AI资讯新闻榜单内容搜索- AI

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
搜索:  AI
Claude 3.7硬控马里奥90秒,GPT-4o开局暴毙!Karpathy直呼基准失效,游戏成LLM新战场

Claude 3.7硬控马里奥90秒,GPT-4o开局暴毙!Karpathy直呼基准失效,游戏成LLM新战场

Claude 3.7硬控马里奥90秒,GPT-4o开局暴毙!Karpathy直呼基准失效,游戏成LLM新战场

Karpathy发出灵魂拷问,评估AI究竟该看哪些指标?答案或许就藏在经典游戏里!最近,加州大学圣迭戈分校Hao AI Lab用超级马里奥等评测AI智能体,Claude 3.7结果令人瞠目结舌。

来自主题: AI资讯
8592 点击    2025-03-03 16:00
AI+居家养老,融资4.2亿美元,住院率降70%,政府凭啥买单?

AI+居家养老,融资4.2亿美元,住院率降70%,政府凭啥买单?

AI+居家养老,融资4.2亿美元,住院率降70%,政府凭啥买单?

在老龄化浪潮和医疗系统承压的双重挑战下,居家养老成为破局关键。英国 Cera Care 独辟蹊径,以 AI 技术驱动数字化平台,不仅与政府深度合作,更实现住院率降低70%的医疗奇迹,日节省百万英镑,为深陷困境的英国医疗体系带来效率革命。

来自主题: AI资讯
9572 点击    2025-03-01 10:52
谷歌发布BIG-Bench超难基准:DeepSeek-R1得分6.8,只有o3-mini超过10分

谷歌发布BIG-Bench超难基准:DeepSeek-R1得分6.8,只有o3-mini超过10分

谷歌发布BIG-Bench超难基准:DeepSeek-R1得分6.8,只有o3-mini超过10分

随着 AI 能力的提升,一个常见的话题便是基准不够用了——一个新出现的基准用不了多久时间就会饱和,比如 Replit CEO Amjad Masad 就预计 2023 年 10 月提出的编程基准 SWE-bench 将在 2027 年饱和。

来自主题: AI技术研报
6411 点击    2025-02-28 14:48
扣子平台智能体与 AI 应用数据分析报告

扣子平台智能体与 AI 应用数据分析报告

扣子平台智能体与 AI 应用数据分析报告

这是智能体平台扣子官方整理的AI应用的相关数据,该报告可以让大家更好的了解用户在智能体方面的创建情况,同时也可以了解智能体平台本身的用户情况,更清楚的分析智能体商业的前景。

来自主题: AI技术研报
10629 点击    2025-02-28 10:04
不要自回归!扩散模型作者创业,首个商业级扩散LLM来了,编程秒出结果

不要自回归!扩散模型作者创业,首个商业级扩散LLM来了,编程秒出结果

不要自回归!扩散模型作者创业,首个商业级扩散LLM来了,编程秒出结果

当前的 AI 领域,可以说 Transformer 与扩散模型是最热门的模型架构。也因此,有不少研究团队都在尝试将这两种架构融合到一起,以两者之长探索新一代的模型范式,比如我们之前报道过的 LLaDA。不过,之前这些成果都还只是研究探索,并未真正实现大规模应用。

来自主题: AI技术研报
11824 点击    2025-02-27 14:40
OpenAI 都在用的 AI 招聘,2 年内实现 7500 万美元 ARR

OpenAI 都在用的 AI 招聘,2 年内实现 7500 万美元 ARR

OpenAI 都在用的 AI 招聘,2 年内实现 7500 万美元 ARR

Mercor 是一家由三位 21 岁的 Thiel Fellows 创办的 AI 招聘初创公司,是科技行业增长最快的公司之一,去年 9 月 ARR 月增长率已经达到 50%,到目前,公司已经实现了 2 年内达到 7500 万美元 ARR 的突破,主要收入来自包括 OpenAI 在内的 AI 实验室。Mercor 近期完成 1 亿美元 B 轮融资,估值达到 20 亿美元。

来自主题: AI资讯
10494 点击    2025-02-27 11:34